Detección del engaño en notas de opinión a través de técnicas tradicionales de clasificación automática de textos
نویسندگان
چکیده
This work studies the scope of traditional techniques used in automatic text classification (v. gr. bag of words) for the deceptive detection. Commonly, traditional techniques work well in thematic classification. However, it is desired to know the performance of these techniques in an intuitively non-thematic task. The collection used is a set of English notes of hotel reviews, including truthful and deceptive notes. Experiments were performed using bag of words with binary weighing schemes, tf and tf-idf and training a probabilistic classifier. The results show that deception can be detected with the traditional approach. A first analysis of these results identifies those elements on which discrimination fell.
منابع مشابه
Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos
Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...
متن کاملDetección de perfiles de usuarios en la Web 2.0 desde el punto de vista emocional
Actualmente, los estudios sociológicos sobre los estados ańımicos se realizan a través de la interpretación de encuestas individuales en las que se formulan preguntas acerca del estado emocional y del bienestar del encuestado. Sin embargo, es bien conocido que el proceso podŕıa dar con interpretaciones erróneas. Es por ello, que el objetivo principal del proyecto de tesis es la creación de técn...
متن کاملEfecto del pre-procesamiento en la detección automática de plagio para PAN 2014 y PAN 2015
Resumen. Dentro de la detección automática de plagio, el alineamiento de texto en [1] lo define como el descubrimiento de fragmentos similares de texto entre dos documentos. La cual puede utilizarse en: detección de plagio, identificación de autoría, detección de reúso de texto, recuperación de información, entre muchas otras. El pre-procesamiento consta de diversas técnicas que se aplica en la...
متن کاملDesarrollo de un sistema para medir similitud entre clases
Resumen. El incremento continuo de información en formato digital obliga a contar con nuevos métodos y técnicas para acceder, recopilar y organizar estos volúmenes de información textual. Una de las técnicas más utilizadas para organizar dicha información es la clasificación de documentos. Los sistemas de clasificación automática de textos tienen una baja eficiencia cuando las clases son muy pa...
متن کاملHerramienta de apoyo en la detección de reutilización de código fuente
Resumen. El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilización de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a través de Internet, esta práctica se ha incrementado. La gran mayoŕıa...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Research in Computing Science
دوره 134 شماره
صفحات -
تاریخ انتشار 2017